더빈-왓슨 검정

1. 개요

더빈-왓슨 검정은 회귀분석에서 모형의 잔차가 서로 독립적인지, 즉 자기상관이 존재하는지를 검정하는 통계적 방법이다. 이 검정은 주로 시계열 데이터를 이용한 회귀분석에서 1차 자기상관의 유무를 판단하는 데 널리 사용된다.

이 검정법은 통계학자 제임스 더빈과 제프리 왓슨에 의해 개발되었으며, 1950년과 1951년에 걸쳐 관련 논문이 발표되었다. 이들의 이름을 따서 더빈-왓슨 검정으로 불리게 되었다.

더빈-왓슨 검정은 계량경제학과 시계열 분석 분야에서 기본적이면서도 중요한 도구로 자리 잡았다. 회귀분석의 기본 가정 중 하나인 오차항의 독립성이 위반될 경우, 추정된 회귀계수의 효율성이 떨어지고 유의성 검정이 부정확해질 수 있기 때문이다. 따라서 이 검정은 모형의 적합성을 평가하는 핵심 절차 중 하나이다.

2. 정의와 목적

더빈-왓슨 검정은 회귀분석에서 얻은 잔차들이 서로 독립적인지, 즉 자기상관이 존재하는지를 검정하는 통계적 방법이다. 이 검정법은 계량경제학자 제임스 더빈과 제프리 왓슨에 의해 개발되어 1950년과 1951년에 걸쳐 발표되었다. 특히 시계열 데이터를 이용한 회귀분석에서 오차항의 독립성 가정이 위배되는지를 확인하는 데 주로 활용된다.

이 검정의 주요 목적은 회귀모형의 기본 가정 중 하나인 오차항의 독립성을 검증하는 것이다. 만약 잔차에 자기상관, 특히 1차 자기상관이 존재한다면, 최소제곱법을 통해 추정된 회귀계수의 분산이 실제보다 과소평가될 수 있으며, 이는 t-검정이나 F-검정과 같은 유의성 검정의 결과를 신뢰할 수 없게 만든다. 따라서 더빈-왓슨 검정은 모형의 타당성을 평가하고, 통계적 추론의 정확성을 보장하기 위한 중요한 도구로 자리 잡았다.

3. 검정 통계량과 계산

더빈-왓슨 검정의 핵심은 검정 통계량 d를 계산하는 것이다. 이 통계량은 회귀분석을 통해 추정된 모델의 잔차들 사이의 연속적인 차이를 기반으로 한다. 구체적으로, 일차 자기상관을 측정하기 위해 1차 시차를 가진 잔차 간의 차이 제곱합을 잔차 제곱합으로 나누어 계산한다. 이 공식은 잔차들이 서로 독립적일 때 기대되는 값인 2에 가까운 값을, 양의 자기상관이 있을 때는 0에 가까운 값을, 음의 자기상관이 있을 때는 4에 가까운 값을 갖도록 설계되었다.

검정 통계량 d의 계산은 비교적 간단하여 많은 통계 패키지에서 기본적으로 제공하는 기능이다. 사용자는 최소제곱법으로 선형 회귀 모델을 추정한 후, 해당 모델의 잔차 시퀀스를 이용해 통계량을 산출할 수 있다. 이 계산 과정은 시계열 데이터를 다루는 계량경제학 연구에서 표준적인 절차의 일부로 자리 잡았다.

계산된 d 통계량의 해석은 특정 유의수준 (예: 0.05) 하에서 미리 정해진 임계값과 비교하여 이루어진다. 임계값은 표본 크기와 설명 변수의 개수에 따라 달라지며, 더빈과 왓슨이 제시한 상한과 하한 값을 기준으로 판정 영역(자기상관 없음, 판정 불가, 자기상관 존재)이 구분된다. 따라서 검정을 수행하려면 해당 표를 참조하거나 통계 소프트웨어의 출력 결과를 확인해야 한다.

4. 해석과 판단 기준

더빈-왓슨 검정 통계량의 값은 일반적으로 0에서 4 사이의 범위를 가진다. 값이 2에 가까울수록 잔차 간에 자기상관이 없다는 귀무가설을 지지하는 증거가 된다. 반면, 값이 0에 가까우면 양의 자기상관이 존재함을 시사하며, 이는 인접한 시점의 잔차들이 유사한 값을 가지는 경향이 있음을 의미한다. 값이 4에 가까우면 음의 자기상관이 존재함을 시사하며, 이는 인접한 시점의 잔차들이 서로 반대 방향의 값을 가지는 경향이 있음을 의미한다.

판단을 위해서는 계산된 검정 통계량 값을 특정 임계값과 비교한다. 임계값은 유의수준, 표본 크기(n), 그리고 설명 변수의 개수(k)에 따라 달라지며, 더빈과 왓슨이 제시한 하한(dL)과 상한(dU) 값을 사용한 표가 일반적으로 참고된다. 예를 들어, 양의 자기상관 검정 시 계산된 통계량이 하한 값보다 작으면 양의 자기상관이 존재한다고 기각하고, 상한 값보다 크면 자기상관이 없다고 채택한다. 하한과 상한 사이의 값은 판단이 불확실한 영역으로, 이 경우 결론을 내리기 어렵다.

이 검정법은 주로 1차 자기상관, 즉 바로 이전 시점의 잔차와의 상관관계를 검출하는 데 초점을 맞추고 있다. 따라서 2차 이상의 고차 자기상관이나 다른 형태의 상관관계를 탐지하는 데는 효과적이지 않을 수 있다. 또한, 검정의 판단 기준이 되는 임계값 표는 회귀 모형에 절편이 포함되어 있고, 설명 변수가 확정적이며, 잔차가 정규 분포를 따른다는 가정 하에 작성되었다는 점에 유의해야 한다.

5. 가정과 한계

더빈-왓슨 검정을 적용하고 결과를 해석하기 위해서는 몇 가지 중요한 가정이 충족되어야 한다. 가장 기본적인 가정은 회귀 분석 모형이 올바르게 설정되었다는 것이다. 즉, 모형에 포함된 설명 변수들이 적절하고, 선형성 가정이 지켜지며, 등분산성 가정이 만족되어야 한다. 또한 검정은 정규 분포를 따르는 오차를 가정하며, 이는 대표본의 경우 완화될 수 있다. 가장 핵심적으로, 더빈-왓슨 검정은 1차 자기상관만을 검출하도록 설계되었다. 이는 잔차와 그 직전 시점의 잔차 간의 상관관계만을 평가한다는 의미로, 2차 이상의 고차 자기상관이나 계절적 자기상관은 탐지하지 못한다.

이 검정법에는 몇 가지 명확한 한계가 존재한다. 첫째, 검정 통계량의 유의수준이 설명 변수의 값에 의존적이라는 점이다. 이는 동일한 자기상관 계수 값이라도 사용된 데이터에 따라 귀무가설을 기각할 수 있는 임계치가 달라질 수 있음을 의미하며, 때로는 판단이 모호한 '불결정 영역'이 발생하는 원인이 된다. 둘째, 교란 변수의 누락으로 인한 설명 변수의 내생성이 있을 경우, 검정 결과가 편향될 수 있다. 셋째, 앞서 언급했듯이 1차 자기상관에만 민감하기 때문에, 이동 평균 과정이나 고차 자기회귀 과정을 따르는 오차에 대해서는 효과적이지 않을 수 있다.

마지막으로, 더빈-왓슨 검정은 시계열 데이터에 가장 적합하며, 횡단면 데이터에는 일반적으로 적용되지 않는다. 또한 표본 크기가 작을 경우 검정력이 낮아질 수 있다. 이러한 가정과 한계를 이해하지 못한 채 검정 결과만을 맹신할 경우, 잘못된 모형을 수용하거나 필요한 조치를 취하지 못하는 오류를 범할 수 있다.

6. 대안 검정법

더빈-왓슨 검정은 주로 1차 자기상관을 검정하는 데 특화되어 있어, 다른 형태의 자기상관이나 특정 상황에서는 대안적인 검정법이 필요할 수 있다. 대표적인 대안으로는 브로슈-갓프레이 검정이 있다. 이 검정은 더빈-왓슨 검정보다 더 일반화된 형태로, 높은 차수의 자기상관을 동시에 검정할 수 있으며, 회귀 모형에 시차 변수가 포함된 경우에도 적용 가능하다는 장점이 있다.

또 다른 중요한 대안은 브로이슈-패간 검정이다. 이 검정은 이분산성과 자기상관을 함께 검정하는 라그랑주 승수 검정의 일종으로, 잔차의 제곱을 이용해 회귀 분석을 수행하는 방식으로 작동한다. 특히 이분산성이 의심되는 상황에서 유용하게 사용된다.

그 외에도 다양한 검정법이 존재한다. 룽-박스 검정은 시계열 분석에서 널리 쓰이는 포트맨토 검정으로, 여러 시차에 걸친 자기상관을 종합적으로 평가한다. 벨슬리 검정은 더빈-왓슨 검정의 비결정 영역 문제를 피하기 위해 개발되었으며, 표준 t-검정의 형태로 결과를 제공해 해석이 직관적이다. 최근에는 벡터 자기회귀 모형 등의 복잡한 모형에서 자기상관을 진단하기 위한 검정법들도 활발히 연구되고 있다.

7. 여담

더빈-왓슨 검정은 계량경제학 분야에서 특히 중요한 위치를 차지한다. 이 검정법은 시계열 데이터를 이용한 회귀분석에서 가장 널리 사용되는 자기상관 검정 도구 중 하나로, 경제 데이터 분석에 필수적으로 적용된다. 그 역사적 가치도 높은데, 이는 통계학의 발전 과정에서 가설 검정 방법론이 실증 분석에 본격적으로 도입되는 시기의 중요한 성과 중 하나로 평가받기 때문이다.

검정의 이름은 두 명의 통계학자, 제임스 더빈과 제프리 왓슨의 이름을 따서 지어졌다. 그들은 1950년과 1951년에 걸쳐 이 방법을 소개하는 논문을 발표했다. 흥미롭게도 두 사람이 공동 연구자였던 것은 아니다. 더빈은 1950년에, 왓슨은 1951년에 각자 독자적으로 유사한 검정 통계량을 제안했고, 이후 이 방법은 두 사람의 이름이 합쳐져 불리게 되었다. 이는 과학적 발견에서 때때론 발생하는 독립적이며 동시다발적인 아이디어의 산물을 보여주는 사례이다.

더빈-왓슨 검정은 그 간결한 계산법과 명확한 해석 덕분에 빠르게 보편화되었다. 초기 계량경제학 교과서들에 필수적으로 수록되면서 수십 년간 표준 검정법으로 자리 잡았다. 그러나 이 검정법이 가지는 한계, 예를 들어 설명 변수에 시차가 포함된 모형에서는 적용할 수 없다는 점이나 부호 검정만 가능하다는 점 때문에, 이후 브로슈-갓프레이 검정이나 롱-박 검정과 같은 보다 일반적인 대안 방법들이 개발되는 동기도 제공하기도 했다.

더빈-왓슨 검정

정의	회귀분석에서 잔차의 독립성(자기상관)을 검정하는 통계적 방법
개발자	제임스 더빈, 제프리 왓슨
최초 등장	1950년, 1951년
주요 용도	시계열 데이터 회귀분석 시 잔차의 1차 자기상관 검정
관련 분야	계량경제학 통계학 시계열 분석
상세 정보
검정 통계량	더빈-왓슨 통계량(d)
통계량 범위	0 ≤ d ≤ 4
해석 기준	d ≈ 2: 자기상관 없음 d ≈ 0: 양의 자기상관 d ≈ 4: 음의 자기상관
가정	회귀 모형의 오차항이 1차 자기회귀 과정(AR(1))을 따름
한계점	지연된 종속변수(시차 변수)가 설명변수로 포함된 모형에는 적용 불가 1차 자기상관만 검정 가능
대안 검정법	브로슈-갓프레이 검정(Breusch–Godfrey test) 룽-박스 검정(Ljung–Box test)

더빈-왓슨 검정

정의	회귀분석에서 잔차의 독립성(자기상관)을 검정하는 통계적 방법
개발자	제임스 더빈, 제프리 왓슨
최초 등장	1950년, 1951년
주요 용도	시계열 데이터 회귀분석 시 잔차의 1차 자기상관 검정
관련 분야	계량경제학 통계학 시계열 분석
상세 정보
검정 통계량	더빈-왓슨 통계량(d)
통계량 범위	0 ≤ d ≤ 4
해석 기준	d ≈ 2: 자기상관 없음 d ≈ 0: 양의 자기상관 d ≈ 4: 음의 자기상관
가정	회귀 모형의 오차항이 1차 자기회귀 과정(AR(1))을 따름
한계점	지연된 종속변수(시차 변수)가 설명변수로 포함된 모형에는 적용 불가 1차 자기상관만 검정 가능
대안 검정법	브로슈-갓프레이 검정(Breusch–Godfrey test) 룽-박스 검정(Ljung–Box test)

더빈-왓슨 검정

1. 개요

2. 정의와 목적

3. 검정 통계량과 계산

4. 해석과 판단 기준

5. 가정과 한계

6. 대안 검정법

7. 여담

편집 제한

편집 제한

문서 정보

분류

편집 제한

문서 정보

분류

편집 제한